ПОСТРОЕНИЕ РЕШАЮЩЕЙ ФУНКЦИИ В СТРУКТУРИРОВАННОМ ПРОСТРАНСТВЕ ПЕРЕМЕННЫХ НА ОСНОВЕ ВЫСКАЗЫВАНИЙ ЭКСПЕРТОВ И ВЫБОРКИ С ИСПОЛЬЗОВАНИЕМ БАЙЕСОВСКОГО ПОДХОДА
Г. С. Лбов, В. М. Неделько
Институт математики СО РАН, Новосибирск, Россия
Abstract — The task of construction of decision functions is considered in a case when the space of values of variables is not presentable by the Cartesian product of sets of values and has complex hierarchical structure. Thus the empirical information can be represented by both sample and statements of the experts. For interpretation of the expert statements the statistical approach allowing to process unmatched or inconsistent statements is offered.
1. Введение
Работа ориентирована на круг задач, когда из самой физической природы задачи следует невозможность дать точное предсказание (например, долгосрочный прогноз погоды). В этих случаях целесообразно оценивать вероятности каждого исхода (образа). Кроме того, в ряде задач требуется именно оценка вероятности заданного исхода с тем, чтобы впоследствии предсказывать долю данных исходов в серии испытаний. В связи с этим мы будем понимать под решающей функцией оценку условного распределения в пространстве прогнозируемых переменных, при условии известных значений измеренных.
При этом рассматривается случай, когда пространство переменных не представляется просто декартовым произведением множеств допустимых значений переменных, а имеет более сложную структуру, а именно, когда области допустимых значений одних переменных зависят от значений, принимаемых другими переменными.
2. Постановка задачи
Пусть
– разнотипный набор переменных и – множество допустимых значений переменной . Поставим каждой в соответствие переменную со множеством значений , при этом будет принимать значение в том случае, когда значение переменной не определено (имеется в виду, что для данного объекта соответствующая характеристика бессмысленна).Определение 1.
Вмещающим пространством назовем декартово произведение .Понятие структурированного пространства
[2] определим рекурсивным способом.Определение 2.
Множество есть структурированное пространство, если – интервал значений в случае, когда – переменная с упорядоченным множеством значений, или если – произвольное подмножество из , когда – номинальная переменная.Объединение непересекающихся структурированных пространств есть структурированное пространство.
Декартово произведение структурированных пространств, не имеющих общих переменных, есть структурированное пространство.
Обозначим через
образ структурированного пространства в .Свойство. Образ любого структурированного пространства представим в виде
, где , а есть либо , либо интервал из в случае, когда – переменная с упорядоченным множеством значений, или – произвольное подмножество , когда – номинальная переменная. При этом .Пример. Пусть имеются переменные:
– пол {м, ж},
– вид вооружения {лук, меч, копье},
– вид украшений,
– рост.
Тогда
{м}{ж} есть структурированное пространство значений переменных (предполагается, что "" имеет приоритет перед "").
Для структурированного пространства можно ввести понятия борелевского множества и лебеговой меры. При этом определение борелевского множества совпадет с определением структурированного пространства с поправкой на возможность счетного объединения множеств. Для определения лебеговой меры следует, как обычно, положить меру интервала значений количественной переменной равной его длине, а меру произвольного подмножества значений дискретной переменной равной числу элементов в нем. Далее, мерой объединения множеств будет сумма, а мерой декартова произведения — произведение их мер.
Сформулируем задачу построения решающей функции.
Пусть
– структурированное пространство измеряемых переменных , а – пространство прогнозируемых переменных . Со стратегией природы свяжем – условное распределение в пространстве прогнозируемых переменных (в дальнейшем, наклонной P будут обозначаться распределения, а прямой P – вероятность события).Требуется указать алгоритм
, который по полученной эмпирической информации строит – оценку стратегии природы.В эмпирических данных могут одновременно присутствовать как обычная выборка, так и вероятностные высказывания экспертов, т. е.
, ,, где – множество всевозможных высказываний вида, где , , – оценка вероятности для .
Для пояснения обозначений приведем пример экспертного высказывания: “Если температура воздуха в 15
00 больше 15оС и температура воздуха в 2100 меньше 7оС или температура воздуха в 2100 меньше 5оС, то заморозок от 0оС до -3оС с вероятностью 0,4, заморозок свыше -3оС с вероятностью 0,2; уверенность 0,8”.Обозначив
= “температура воздуха в 1500”, = “температура воздуха в 2100”, = “заморозок”, имеем,
,
,
3. Байесовский подход
Предлагаемый метод решения задачи состоит в получении апостериорной (при заданной эмпирической информации) вероятностной меры на стратегиях природы с использованием формулы Байеса:
,
где
– функция правдоподобия для выборки, – априорное распределение на классе стратегий природы.Поскольку эксперты делают высказывания независимо и выборочные точки также независимы, то
. При этом, если – точка, то есть значение плотности вероятностной меры относительно лебеговой меры (распределение в полагаем равномерным). Если – высказывание, то.
Здесь
– некоторая эвристически подобранная функция, – мера несоответствия между высказыванием эксперта и стратегией природы (например, среднеквадратичное отклонение условной плотности, соответствующей стратегии , от экспертных оценок), а , где – равномерное распределение в .Для задания априорной вероятностной меры на стратегиях природы выберем подкласс
– распределений с кусочно-постоянными плотностями, у которых области постоянства представляются в виде , где , . Меру положим равной нулю.Представим
как , где – класс распределений с областями постоянства. Поскольку вид областей постоянства фиксирован, любое распределение из можно задать конечным числом параметров. При этом – пространство значений данных параметров будет представлять собой некоторый –мерный многогранник. Тогда параметризует .На
зададим меру , где , а – равномерное распределение на .После того, как апостериорное распределение на стратегиях природы получено, в качестве решения можно взять усредненную по данному распределению стратегию.
4. Заключение
Введенное понятие структурированного пространства было использовано для представления данных по погребальным комплексам
[3]. Данный формализм позволил достаточно адекватно отразить иерархическую структуру объектов изучения.Предложенный метод построения решающей функции позволяет строить решение в структурированном пространстве переменных, учитывая иерархическую взаимосвязанность переменных. При этом может использоваться разнородная эмпирическая информация, представленная как выборкой, так и экспертными высказываниями, которые могут быть также противоречивыми.
Работа выполнена при поддержке РФФИ, проект № 980100673.
Литература
1. Лбов Г. С., Неделько В. М. "Байесовский подход к
решению задачи прогнозирования на основе информации экспертов и таблицы данных". // Доклады РАН. Том 357. № 1997. С. 29–32.2. Неделько В. М. "Байесовская стратегия построения решающей функции в структурированном пространстве". // V Международная конференция "Компьютерный анализ данных и моделирование". Сб. статей. Ч. 4. Минск, 1998. С. 81–85.
3. Деревянко Е.И., Лбов Г.С., Худяков Ю.С., Бериков В.Б., Неделько В. М. и др.
"Компьютерная система анализа данных погребальных памятников эпохи неолита и ранней бронзы". В сборнике: "Интеграционные программы фундаментальных исследований" – Новосибирск: СО РАН, 1998, с. 135 – 143.Site of Information
Technologies Designed by inftech@webservis.ru. |
|